È capitato a tutti di eseguire una ricerca ottenendo una
pagina in cui la parola chiave specificata non compare per nulla.
I motivi possono essere diversi, quasi tutti riconducibili al
fatto che i motori di ricerca non eseguono un controllo in tempo
reale di tutte le pagine del Web (i tempi di attesa per i collegamenti,
infatti, sarebbero mostruosi). Essi producono risposte velocissime
perché in realtà consultano un proprio database
in cui sono contenuti dei sommari di tutte le pagine visitate
in precedenza da un apposito software. Questo, detto crawler,
spider o scooter, periodicamente legge gran parte delle pagine
del Web registrando per ognuna l'url, il testo (o parte di esso
se molto lungo) e soprattutto i meta tag html. Questi sono componenti
di codice che consentono all'autore della pagina Web di inserire
informazioni supplementari e istruzioni per il browser su come
leggere la pagina, il tutto invisibile al navigatore. I meta tag
più rilevanti per i motori di ricerca sono i seguenti:
<title>: consente di specificare un titolo per la pagina
in questione.
<description>: consente di specificare un sommario che descrive
il contenuto della pagina o del sito cui essa appartiene.
<keywords>: consente di specificare una serie di parole
chiave rappresentative del contenuto della pagina o del sito cui
essa appartiene.
Essendo i meta tag invisibili ai navigatori ma non ai motori (con
l'eccezione di Excite), ecco spiegate la comparsa delle pagine
apparentemente "sbagliate". Ma il colpevole può
anche essere un altro tag, il meta tag <refresh>, che indica
al browser di caricare automaticamente un'altra pagina senza che
tale passaggio sia notato dal navigatore. Si tratta di un trucchetto
ai limiti dello spamming, espediente usato da chi vuole ingannare
i motori di ricerca facendo loro memorizzare una pagina opportunamente
riempita di parole chiave nascoste, per poi presentare all'utente,
al momento del clic sul collegamento, la home page del sito. Che
ovviamente non ha niente a che fare con quanto egli cercava.
|